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Resumo 

Neste trabalho sao referidas motivates, aplicagoes e relacpes da teoria 
do controlo com outras areas da matematica. Apresentamos uma breve 
resenha historica sobre o controlo optimo, desde as suas origens no calculo 
das variacpes e na teoria classica do controlo aos dias de hoje, dando 
especial destaque ao princlpio do maximo de Pontryagin. 

Palavras chave: controlo optimo, principio do maximo de Pontryagin, 
aplicacoes da teoria matematica dos sistemas de controlo. 

Abstract 

In this work we refer to motivations, applications, and relations of 
control theory with other areas of mathematics. We present a brief his- 
torical review of optimal control theory, from its roots in the calculus of 
variations and the classical theory of control to the present time, giving 
particular emphasis to the Pontryagin maximum principle. 
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1 Introdugao 



Todos nos ja tentamos, numa ou outra ocasiao, manter em equillbrio uma vara 
sobre o dedo indicador (i.e., resolver o problema do pendulo invertido). Por 
outro lado e muito mais dificil, sobretudo se fecharmos os olhos, manter em 
equillbrio um pendulo invertido duplo. A teoria do controlo permite faze-lo sob 
a condigao de dispormos de um bom modelo matematico. 

Um sistema de controlo e um sistema dinamico, que evolui no tempo, so- 
bre o qual podemos agir atraves de uma fungao de comando ou controlo. Um 
computador, que permite a um utilizador efectuar uma serie de comandos, um 
ecossistema sobre o qual podemos agir favorecendo esta ou aquela especie, os 
tecidos nervosos que formam uma rede controlada pelo cerebro e realizam a 
transformagao de estfmulos provenientes do exterior em acgoes do organismo, 
um robot que deve efectuar uma tarefa bem precisa, uma viatura sobre a qual 
agimos por intermedio de um pedal de aceleragao, de travagem e embraiagem e 
que conduzimos com a ajuda de um volante, um satelite ou uma nave espacial, 
sao todos eles exemplos de sistemas de controlo, os quais podem ser modelados 
e estudados pela teoria dos sistemas de controlo. 

A teoria do controlo analisa as propriedades de tais sistemas, com o intuito 
de os "conduzir" de um determinado estado inicial a um dado estado final, respei- 
tando eventualmente certas restrigoes. A origem de tais sistemas pode ser muito 
diversa: mecanica, electrica, biologica, qumiica, economica, etc. O objectivo 
pode ser o de estabilizar o sistema tornando-o insenslvel a certas perturbagoes 
(problema de estabilizacao) ou ainda determinar as solugoes optimas relativa- 
mente a um determinado criterio de optimizagao (problema do controlo optimo). 
Para modelar os sistemas de controlo podemos recorrer a equagoes diferenciais, 
integrals, funcionais, de diferengas finitas, as derivadas parciais, determimsticas 
ou estocasticas, etc. Por esta razao a teoria do controlo vai beber e contribui 
em numerosos dommios da matematica (vide, e.g., [4| [TT j \12 \ |2T | l23 j \27\). 

A estrutura de um sistema de controlo e representada pela interconexao de 
certos elementos mais simples que formam sub-sistemas. Neles transita infor- 
macao. A dinamica de um sistema de controlo define as transformagoes possiveis 
do sistema, que ocorrem no tempo de maneira determinista ou aleatoria. Os 
exemplos ja dados mostram que a estrutura e a dinamica de um sistema de 
controlo podem ter significados muito diferentes. Em particular, o conceito de 
sistema de controlo pode descrever transformagoes discretas, contmuas, hibridas 
ou, de um modo mais geral, numa time scale ou measure chain [131 fl4l [22], 

Um sistema de controlo diz-se controldvel se o podemos "conduzir" (em 
tempo finito) de um determinado estado inicial ate um estado final prescrito. 
Em relagao ao problema da controlabilidade, Kalman demonstrou em 1949 um 
resultado importante que caracteriza os sistemas lineares controlaveis de dimen- 
sao finita (Teorema [7]) . Para sistemas nao lineares o problema matematico da 
controlabilidade e muito mais dificil e constitui um dommio de investigagao 
ainda activo nos dias de hoje. 

Assegurada a propriedade de controlabilidade, podemos desejar passar de 
um estado inicial a um estado final minimizando ou maximizando um determi- 
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nado criterio. Temos entao um problema de controlo optimo. Por exemplo, um 
condutor que efectue o trajecto Lisboa-Porto pode querer viajar em tempo mm- 
imo. Nesse caso escolhe o trajecto pela auto-estrada Al. Uma consequencia de 
tal escolha sera o pagamento de portagem. Outro problema de controlo optimo e 
obtido se tivermos como criterio de minimizagao os custos da viagem. A solugao 
de tal problema envolvera a escolha de estradas nacionais, gratuitas, mas que 
levam muito mais tempo a chegar ao destino (segundo a informagao do sitio 
da internet http://www.google.pt/maps o trajecto pela auto-estrada dura 3h 
e pela estrada nacional dura 6h45m). Um problema de controlo optimo pode 
ser formulado do seguinte modo. Consideremos um sistema de controlo, cujo 
estado num determinado instante e representado por um vector. Os controlos 
sao fungoes ou parametros, habitualmente sujeitos a restrigoes, que agem sobre 
o sistema sob a forma de forgas exteriores, de potenciais termicos ou electricos, 
de programas de investimento, etc. e afectam a dinamica. Uma equagao e dada, 
ou tipicamente um sistema de equagoes diferenciais, relacionando as variaveis 
e modelando a dinamica do sistema. E depois necessario utilizar a informagao 
presente e as caracteristicas do problema para construir os controlos adequa- 
dos que vao permitir realizar um objective precise Por exemplo, quando nos 
deslocamos na nossa viatura agimos de acordo com o codigo da estrada (pelo 
menos e aconselhavel) e concretizamos um piano de viagem para chegar ao nosso 
destino. Sao impostas restrigoes sobre a trajectoria ou sobre os controlos, que 
e imprescindivel ter em consideragao. Fixamos um criterio permitindo medir a 
qualidade do processo escolhido. Este apresenta-se normalmente sob a forma de 
uma funcional que depende do estado do sistema e dos controlos. Para alem das 
condigoes anteriores procuramos ainda minimizar (ou maximizar) esta quan- 
tidade. Um exemplo ja dado anteriormente e o de deslocarmo-nos em tempo 
minimo de um ponto a outro. Notemos que a forma das trajectorias optimas 
depende fortemente do criterio de optimizagao. Por exemplo, para estacionar o 
nosso carro e facil verificar que a trajectoria seguida difere se queremos realizar 
a operagao em tempo mmimo (o que e arriscado) ou minimizando a quantidade 
de combustivel gasta na operagao. 

A teoria do controlo optimo tem uma grande importancia no dommio aeroes- 
pacial, nomeadamente em problemas de condugao, transferencia de orbitas aero- 
assistidas, desenvolvimento de langadores de satelites recuperaveis (o aspecto 
financeiro e aqui muito importante) e problemas da reentrada atmosferica, 
como seja o famoso projecto Mars Sample Return da Agenda Espacial Eu- 
ropeia (ESA), que consiste em enviar uma nave espacial ao planeta Marte com 
o objectivo de trazer amostras marcianas (Figura[T|). 

2 Breve resenha historica 

O calculo das variagoes nasceu no seculo dezassete com o contributo de Bernoulli, 
Fermat, Leibniz e Newton. Alguns matematicos como H.J. Sussmann e J.C. Willems 
defendem a origem do controlo optimo coincidente com o nascimento do cal- 
culo das variagoes, em 1697, data de publicagao da solugao do problema da 
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Figura 1: a teoria do controlo optimo tem um papel importante na engenharia 
aeroespacial. 

braquistocrona pelo matematico Johann Bernoulli [28j. Outros vao ainda mais 
longe, chamando a atengao para o facto do problema da resistencia aerodinamica 
de Newton, colocado e resolvido por Isaac Newton em 1686, no seu Principia 
Mathematica, ser um verdadeiro problema de Controlo Optimo [25, 30j. 

Em 1638 Galileu estudou o seguinte problema: determinar a curva sobre a 
qual uma pequena esfera rola sob a acgao da gravidade, sem velocidade inicial e 
sem atrito, de um ponto A ate um ponto B com um tempo de percurso mmimo 
(escorrega de tempo mmimo, ver Figura [2]). 




Figura 2: problema da braquistocrona. 

Trata-se do problema da braquistocrona (do grego brakhistos, "o mais breve", 
e chronos, "tempo"). Galileu pensou (erradamente) que a curva procurada era 
um arco de circulo. Observou no entanto, correctamente, que o segmento de 
linha recta nao e o caminho de tempo mais curto. Em 1696, Jean Bernoulli 
colocou este problema como um desafio aos melhores matematicos da sua epoca. 
Ele proprio encontrou a solugao, assim como o seu irmao Jacques Bernoulli, 
Newton, Leibniz e o marques de l'Hopital. A solugao e um arco de cicloide 
comegando com uma tangente vertical [20l[28]. As rampas de skate assim como 
as descidas mais rapidas dos aqua-parques, tem a forma de cicloide (Figura \3§ . 
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Figura 3: arcos de cicloide conduzem as descidas mais rapidas e a adrenalina 
maxima. 

A teoria do controlo optimo surge depois da segunda guerra mundial, re- 
spondendo a necessidades praticas de engenharia, nomeadamente no dommio da 
aeronautica e da dinamica de voo. A formalizacao desta teoria colocou varias 
questoes novas. Por exemplo, a teoria do controlo optimo motivou a introdugao 
de novos conceitos de solucoes generalizadas na teoria das equacoes diferenciais 
e originou novos resultados de existencia de trajectorias. Regra geral, considera- 
se que a teoria do controlo optimo surgiu em finais dos anos cinquenta na antiga 
Uniao Sovietica, em 1956, com a formulagao e demonstragao do Princlpio do 
Maximo de Pontryagin por L.S. Pontryagin (Figura H]) e pelo seu grupo de 
colaboradores: V.G. Boltyanskii, R.V. Gamkrelidze e E.F. Mishchenko [24]. 



J 



Figura 4: Lev Semenovich Pontryagin (3/Set/1908 - 3/Maio/1988) 



Pontryagin e os seus companheiros introduziram um aspecto de importancia 
primordial: generalizaram a teoria do calculo das variagoes a curvas que tomam 
valores em conjuntos fechados (com fronteira). A teoria do controlo optimo 
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esta muito ligada a mecanica classica, em particular aos principios variacionais 
(principio de Fermat, equagoes de Euler-Lagrange, etc.) Na verdade o princi- 
ple, do maximo de Pontryagin e uma generalizagao das condigoes necessarias de 
Euler-Lagrange e de Weierstrass. Alguns pontos fortes da nova teoria foram a 
descoberta do metodo de programagao dinamica, a introdugao da analise fun- 
cional na teoria dos sistemas optimos e a descoberta de ligagoes entre as solugoes 
de um problema de controlo optimo e os resultados da teoria de estabilidade 
de Lyapunov [HH [32] ■ Mais tarde apareceram as fundagoes da teria do controlo 
estocastico e da filtragem em sistemas dinamicos, a teoria dos jogos, o controlo 
de equagoes com derivadas parciais e os sistemas de controlo hfbrido - algumas 
de entre as muitas areas de investigagao actual flj 1X9], [27] . 

3 Controlo optimo linear 

A teoria do controlo optimo e muito mais simples quando o sistema de con- 
trolo sob consideragao e linear. O controlo optimo nao linear sera abordado na 
SecgaoHJ A teoria linear ainda e, nos dias de hoje, a mais usada e conhecida 
nas areas de engenharia e suas aplicagoes. 

3.1 Questoes centrais 

Seja A G A4„(R) (denotamos por M n (R.) o conjunto das matrizes n X n de 
entradas reais); B. X e M n ,i(R) — M"; I um intervalo de R; e u : M — » R uma 
fungao mensuravel (u £ L 1 ) tal que u{t) S / Vt0 O teorema de existencia de 
solugao para equagoes diferenciais assegura a existencia de uma unica aplicagao 
l9(Hl(()el" absolutamente contmua (X e AC) tal que 

X{t) = AX{t)+Bu{t) Vi, 

A(0) = X Q . (1) 

Esta aplicagao depende do controlo u. Ao mudarmos a fungao u obtemos uma 
outra trajectoria t y—f X(t) em R" (FiguraE]). 

Neste contexto, surgem naturalmente duas questoes: 

(i) Dado um ponto X\ e R n , existira um controlo u tal que a trajectoria 
associada a esse controlo liga Ao a Xi em tempo finito T? (Figura[6]) E este o 
problema da controlabilidade. 

(ii) Assegurada a controlabilidade (questao anterior), existira um controlo 
que minimiza o tempo de percurso de Xq ate X\l (Figura[7]) Temos entao um 
problema de controlo optimo (de tempo mmimo). 

Os teoremas que se seguem respondem a estas questoes. As respectivas 
demonstragoes sao bem conhecidas e podem facilmente ser encontradas na lit- 
erature (vide, e.g., [18 ] |2" H l33j). 

x Nas aplicagSes considera-se normalmente como classe dos controlos admissiveis o conjunto 
dos controlos seccionalmente continuos ou mesmo seccionalmente constantes. Mostra-se que 
a familia de trajectorias correspondentes aos controlos seccionalmente constantes e densa no 
conjunto de todas as solugoes com controlos mensuraveis (vide, e.g., [3]). 
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Figura 5: a trajectoria solugao do sistema de controlo (U) depende da escolha 
concreta do controlo u. 



X(t) 




Figura 6: problema da controlabilidade. 




Figura 7: problema do tempo mmimo. 
3.2 Conjunto acessfvel 

Considerando o sistema linear de controlo ([I]) comegamos por introduzir um 
conjunto de grande importancia: o conjunto acesswel. 

Definigao 1. conjunto dos pontos acesslveis a partir de Xq em tempo T > 
e denotado e definido por 

A(X Q ,T) = {X 1 GM n |3ueL 1 ([0,r],/), 

3X : R R n e AC com X(0) = X , 

Vt e [0, T] X(t) = AX(t) + Bu{t), X{T) = X x } . 

Por palavras, A(Xq,T) e o conjunto das extremidades das solugoes de |T]) 
em tempo T, quando fazemos variar o controlo u (Figura [8]). 



7 



Figura 8: conjunto acesslvel. 



Teorema 2. Sejam T > 0, I compacto e Xq G R ra . Entao para todo ot<=z [0, T], 
A(Xo,t) e compacto, convexo e varia continuamente com t em [0,T]. 

A solugao de 



Constatamos que se Xq = 0, i.e., se partirmos da origem, entao a expressao de 
X(t) e simplificada: X(t) = e tA J Q e~ sA Bu(s)ds e linear em u. Esta observagao 
leva-nos a seguinte proposigao. 

Proposigao 3. Suponhamos que Xq = e J = R. Entao, 

1. VT > A(0,T) e um sub-espago vectorial de R™. Alem disso, 

2. < Ti < T 2 A(0,Ti) c A(Q,T 2 ). 

DeflniQao 4. conjunto A(0) — Ut>o^4(0, T) e o conjunto dos pontos acesslveis 
(num tempo qualquer) a partir da origem. 

Corolario 5. O conjunto A(0) e um sub-espago vectorial de K n . 
3.3 Controlabilidade 

O sistema de controlo X = AX + Bu diz-se controlavel se para todo o Xq,X\ e 
K™ existe um controlo u tal que a trajectoria associada une Xq a X\ em tempo 
finito T (Figura [9|). De modo mais formal temos: 

Definigao 6. O sistema de controlo X = AX + Bu diz-se controlavel se 




(2) 



c 




VX ,Xi6M™ 3T>0 3u : [0, T] — > 7 6 L 1 
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fX = AX + Bu , 
X(0) = X , 
X(T) = Xi . 




Figura 9: controlabilidade. 

teorema seguinte da-nos uma condigao necessaria e suficiente de contro- 
labilidade chamada condigao de Kalman. 

Teorema 7 (Condigao de Kalman). O sistema X — AX + Bu e controldvel 
se e somente se a matrix C = (B\AB\ ■ ■ ■ \A n ~ 1 B) tiver caracteristica completa 
(i.e., rank(C) =n). 

3.4 Principio do Maximo de Pontryagin para o problema 
de tempo mfnimo 

Comegamos por formalizar, com a ajuda do conjunto acessivel A(Xq, t), a nogao 
de tempo mfnimo. 

Sejam Xq,Xi e M™. Suponhamos que X\ e acessivel a partir de Xq, i.e., 
suponhamos que existe pelo menos uma trajectoria unindo Xq a X±. De entre 
todas as trajectorias que unem Xq a X\ gostariamos de caracterizar aquela que 
o faz em tempo mmimo T (Figura fT0|) . 




Figura 10: qual a trajectoria X para a qual T e mmimo? 

Se T for o tempo mmimo, entao para todo o t < T, X\ £ A(Xq,T) (com 
efeito, se assim nao fosse Xi seria acessivel a partir de Xq num tempo inferior 
a T e T nao seria o tempo mmimo). Consequentemente, 

T = inf{t> 0\Xi G A(X ,t)}. (3) 

valor de T esta bem definido pois, a partir do TeoremaHl A(Xq, t) varia con- 
tinuamente com t, logo {t > | X\ € A(Xo,t)} e fechado em K. Em particular 
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> 

A(X ,t) 



Figura 11: o tempo minimo T corresponde ao primeiro instante t para o qual 

A(x ,t)n{x 1 }^9. 

o mfimo em ((3J) e minimo. tempo t = T e o primeiro instante para o qual 
A(X ,t) contem X x (Figura [XT]) . 

Por outro lado, temos necessariamente: 



Com efeito, se X\ pertencesse ao interior de A(X 0l T), entao para t < T proximo 
de T, Xi pertenceria ainda a A(X ,t) pois A(X ,t) varia continuamente com 
t. Isto contradiz o facto de T ser o tempo minimo. Estas observagoes dao uma 
visao geometrica a nogao de tempo minimo e conduzem-nos a seguinte definigao: 

Definigao 8. Seja u 6 i 1 ([0, T],I). O controlo u diz-se optimo para o sistema 
HJ se a correspondente trajectoria X verifica X(T) E Fr A(X , T). 

Dizer que u e optimo e dizer que a trajectoria associada a u une Xq a X\ 
em tempo minimo. O objectivo e entao o de determinar os controlos optimos. 
O teorema que se segue da-nos uma condicao necessaria e suficiente de optimal- 
idade. 

Teorema 9 (Principio do Maximo de Pontryagin (caso linear)). Considere-se 
o sistema de controlo 



Seja T > 0. controlo u € L 1 ([0,T],7 = [—1, 1]) e optimo se e somente se 



onde (•,•) e o produto interno em W 1 e r/(t) E K™ e solucao da equacao f] T 



A condigao inicial 77(0) depende de X\. Como ela nao e directamente con- 
hecida, a utilizagao do Teorema [9] e maioritariamente indirecta. Vejamos um 
exemplo. 



Xi E Fr A(X , T)\int A(X , T) . 




u(t) = sinal(ri(t), B) 



i T A. 
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3.5 Exemplo: controlo optimo de urn oscilador harmonico 
(caso linear) 

Consideremos uma massa pontual m ligada a uma mola cujo movimento esta 
restrito a um eixo Ox (Figura [T2j) . 



x 



Figura 12: sistema massa- mola. 

A massa pontual sai da origem por uma forga que supomos igual a 

-ki(x - I) - k 2 (x - I) 3 

onde I e o comprimento da mola em repouso. Aplicamos a essa massa pontual 
uma forga exterior horizontal u(t)l. A segunda Lei de Newton diz-nos que a 
forga resultante aplicada e directamente proporcional ao produto entre a massa 
inercial e a aceleragao adquirida pela mesma, ou seja 

mx(t) + ki(x(t) -l) + k 2 (x(t) - I) 3 = u(t) . (4) 

As leis basicas da Flsica dizem-nos tambem que todas as forgas sao limitadas. 
Impomos a seguinte restrigao a forga exterior: 

|tt(t)|<l Vt. 

Isto significa que a forga apenas pode tomar valores no intervalo fechado [—1, 1]. 
Suponhamos que a posigao e a velocidade iniciais do objecto sao, respectiva- 
mente, x(0) = xq e i(0) = yo. O problema consiste em trazer, em tempo 
mmimo, a massa pontual a posigao de equilibrio x — I por escolha adequada da 
forga externa u(t) e tendo em conta a restricao \u(t)\ < 1. A forga u e aqui o 
nosso controlo. 

Problema. Dadas as condigoes iniciais x(0) = xo e x(0) — y , encontrar a fungao 
u que permite transportar a massa para a sua posigao de equilibrio em tempo 
mmimo. 

3.5.1 Modelagao matematica 

Para simpliflcar a apresentagao, vamos supor m — lkg, ki — IN.m^ 1 e I — 
Om (passamos a I = por translagao). A equagao de movimento $4$) e entao 
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equivalente ao sistema diferencial de controlo 
(x(t)=y(t) 

\y(t) = -x(t) - k 2 x(t) 3 + u(t) (5) 
x{0) = x , i(0) = y ■ 

Escrevemos facilmente © na notagao matricial 

X = AX + f(X) + Bu, X(0)=X , (6) 

tomando 

Hi) 

Tendo em mente que estamos na secgao de controlo linear fixamos k 2 = 0, 
desprezando efeitos conservatives nao lineares (na Secgao [H onde abordamos o 
controlo optimo nao linear, consideraremos o caso k 2 ^ 0). Para k 2 — temos 
f(X) = e obtemos o sistema de controlo © na forma (J2]) (sistema de controlo 
linear). Pretendemos responder a duas questoes: 

1. Existira sempre, para toda e qualquer condigao inicial x(0) = xq e i(0) = 
?/o, uma forga exterior horizontal (um controlo) que permite transportar 
em tempo finito T a massa pontual para sua posigao de equih'brio x(T) = 
e x{T) = 0? 

2. Se a primeira pergunta for respondida positivamente, qual a forga (qual 
o controlo) que minimiza o tempo de transporte da massa pontual a sua 
posigao de equilibrio? 

3.5.2 Controlabilidade do sistema 

O nosso sistema escreve-se na forma 

jx = AX + Bu 
\X(0) = X 

coin 1 j j J j eB = ( J ) . Temos entao 



rank (B\AB) = rank 



1 

1 



e o Teorema [7] garante-nos que o sistema e controlavel (se u{t) € E). Isto 
significa que existem controlos para os quais as trajectorias associadas unem Xq 
a 0. Temos assim resposta afirmativa a nossa primeira questao, admitindo que 
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o sistema mantem-se controlavel com controlos que verificam a restrigao \u\ < 1 
(o que sera verificado a posteriori). Esta resposta e esperada em termos fisicos. 
Se nao aplicarmos uma forga exterior, i.e., se u = 0, a equagao do movimento e 
x+x = e a massa pontual oscila sem nunca parar, nunca voltando a sua posigao 
de equillbrio em tempo finito. Por outro lado, ao aplicarmos determinadas forgas 
exteriores, temos tendencia a amortecer as oscilagoes. A teoria do controlo preve 
que conseguimos realmente parar a massa em tempo finito. 



3.5.3 Determinagao do controlo optimo 

Sabemos que existem controlos que permitem conduzir o sistema de Xq a 0. 
Agora queremos determinar, em concreto, qual desses controlos o faz em tempo 
mmimo. Para isso aplicamos o Teorema[9l 

u(t) = sinal (f](t), B) , 
onde r)[t) el 2 e solugao de r) T = -ij T A. Seja rj(t) — ( ^ }) ) . Entao, u(t) = 



sinalrj2(t) e fji — 772, 772 = — 771, ou seja, ^2+772 = 0. Logo 772 (t) = Acos£+/xsint. 
Consequentemente, o controlo optimo e seccionalmente constante em intervalos 
de comprimento ir e toma valores alternadamente ±1. 

• Se u = — 1, obtemos o sistema diferencial 

(7) 




Se u = +1, obtemos 




(8) 



A trajectoria optima unindo Ao a e constitulda por pedagos de solugoes de 
lO e ([8]) concatenadas. As solugoes de (7]) e J8]) sao facilmente obtidas: 

x = y, y = -x-l =► -^-((x + if + y 2 ) = 
ax 

(x + l) 2 + y 2 = const = R 2 

e concluimos que as curvas solugoes de |(7]) sao circulos centrados em x = — 1 
e y = de perlodo 2tt (com efeito, x(t) = — 1 + Rcost e y{t) = Rsmt); como 
solugoes de ([8]) obtemos x(t) = 1 + Rcost e y(t) = i?sint, i.e., as solugoes de 
([8]) sao circulos centrados em x=ley = 0de periodo 2ir. 

A trajectoria optima de Xq ate segue alternadamente um arco de circulo 
centrado em x = —1 e y = e um arco de circulo centrado em x ~ 1 e y = 0. O 
estudo detalhado da trajectoria optima e a sua implementagao numerica, para 
todo e qualquer Xq, podem ser encontrados em |33j . 
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4 Controlo optimo nao linear 

Apresentamos agora algumas tecnicas para a analise de problemas de controlo 
optimo nao lineares. Em particular, formulamos o Principio do Maximo de 
Pontryagin numa forma mais geral do que aquela que vimos na Secgao [3j O 
exemplo nao linear da massa-mola sera tratado como exemplo de aplicagao. 

4.1 Problematica geral 

De um ponto de vista global, o problema deve se formulado numa variedade M, 
mas o nosso ponto de vista vai ser local e trabalhamos sobre um aberto V de 1" 
suficientemente pequeno. A problematica geral do controlo optimo e a seguinte. 
Consideremos um sistema de controlo 

x(t) = f(x(t),u(t)) (9) 

sobre V onde / : W 1 x E m — » M" e "suave'H e o conjunto dos controlos admisslveis 
U e composto por aplicagoes u : [0, T(u)] — > il C M. m mensuraveis limitadas. 
Dada uma aplicagao f° : M. n x M. rn — > R, denotamos por 

C(u) = I f{x(t),u(t))dt 
Jo 

o custo de uma trajectoria x : t ^ x(t) associada a u{-) e definido sobre [0, T'(u)] , 
T'(u) < T(u). Sejam Mo e Mi duas sub-variedades regulares de V. O problema 
do controlo optimo consiste em encontrar, de entre todas as trajectorias que 
unem Mq a Mi, aquelas cujo custo e mmimo. Comegamos por restringir-nos ao 
caso em que Mq e Mi sao pontos xq e xi de V. Sendo o nosso ponto de vista 
local, podemos sempre supor que xq = 0. 

4.2 Aplicagao entrada-saida 

Consideremos para o sistema ([9]) o seguinte problema de controlo: dado um 
ponto x\ £ V, encontrar um tempo T e um controlo u sobre [0, T] tal que a 
trajectoria x u associada a u, solugao de ([9]), verifica 

Xu(0) = 0, x u (T) = xt . 

Isto leva-nos a definir: 

Definigao 10. Seja T > 0. A aplicagao entrada-saida em tempo T do sistema 
de controlo ([9]) inicializado em e a aplicagao: 

E T :U->V 
u i-> x u (T) 

2 F.H. Clarke criou nos anos setenta a chamada "Analise Nao-Suave" (Nonsmooth Analysis) 
que permite o estudo de problemas de controlo optimo mais gerais, em que as fungSes envolvi- 
das nao sao necessariamente diferenciaveis no sentido classico. Dado o caracter introdutorio 
do nosso texto, restringimo-nos ao caso "suave" no sentido C°° : todos os objectos manipula- 
dos sao aqui, salvo casos particulares mencionados, C°°. Remetemos o leitor interessado na 
Analise Nao-Suave para \E\ \7\ E] . 
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onde U e o conjunto dos controlos admissrveis. 

Por outras palavras, a aplicagao entrada-saida em tempo T associa a um 
controlo u o ponto final da trajectoria associada a u. Uma questao importante 
na teoria do controlo e estudar esta aplicagao Et, descrevendo a sua imagem, 
as suas singularidades, a sua regularidade, etc. A resposta a estas questoes 
depende, obviamente, do espago U de partida e da forma do sistema (da fungao 
/). Com toda a generalidade temos o seguinte resultado (vide, e.g., jT7j I27|). 

Proposigao 11. Consideremos o sistema ((9]) onde f e "suave" cWc L°°([0, T}). 
Entao Et e "suave" no sentido L°° . 

Seja u £ U um controlo de referenda. Exprimamos a diferenciabilidade (no 
sentido de Frechet) de Et no ponto u. Consideremos A(t) — ^(x u (t),u(t)) e 
B{t) = ^(x u (t),u(t)). sistema 



e chamado sistema linearizado ao longo de (x u ,u), diferencial de Frechet de 
Et em u e a aplicagao 



onde M e a solugao matricial de M = AM, M(0) = Id. 

4.3 Controlos singulares 

Seja u um controlo definido sobre [0, T] tal que a trajectoria partindo de x(0) = 
xq e definida sobre [0, T]. Dizemos que o controlo u (ou a trajectoria x u ) e 
singular sobre [0, T] se o diferencial de Frechet dET(u) da aplicagao entrada- 
saida no ponto u nao e sobrejectiva. Caso contrario dizemos que u e regular. 

Proposigao 12. Sejam xo e T fixos. Se u e um controlo regular, entao Et e 
uma aplicagao aberta numa vizinhanga de u. 

4.4 Conjunto acessivel e controlabilidade 

conjunto acessivel em tempo T para o sistema Q, denotado por A(T), e o 
conjunto das extremidades em tempo T das solugoes do sistema partindo de 0. 
Por outras palavras, e a imagem da aplicagao entrada-saida em tempo T. 



y v (t) = A(t)y v {t) + B{t)v(t) 

y v (o) = o 




Deflni^ao 13. O sistema © diz-se controlavel se 



u T > ^(T) = r . 
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Argumentos do tipo do teorema da fungao implicita permitem deduzir os 
resultados de controlabilidade local do sistema de partida a partir do estudo da 
controlabilidade do sistema linearizado (vide, e.g., [13)- Por exemplo, deduzi- 
mos do teorema de controlabilidade no caso linear a proposigao seguinte. 

Proposigao 14. Consideremos o sistema de controlo J9]) onde /(0, 0) = 0. Seja 
A =§£(0,0) e S = |X(0,0). Se 

rank (B\AB\ ■ ■ ■ \A n ~ 1 B) = n 

entao o sistema nao linear ([9]) e localmente controldvel em 0. 

Em geral o problema da controlabilidade e dificil, Diferentes abordagens sao 
posslveis. Umas fazem uso da Analise, outras da Geometria, outras ainda da 
Algebra. problema da controlabilidade esta ligado, por exemplo, a questao 
de saber quando um determinado semi-grupo opera transitivamente. Existem 
tambem tecnicas para mostrar, em certos casos, que a controlabilidade e global. 
Uma delas, importante, e a chamada "tecnica de alargamento" (vide [17]). 

4.5 Existencia de controlos optimos 

Para alem de um problema de controlo, consideramos tambem um problema de 
optimizagao: de entre todas as solugoes do sistema ((9|) unindo a x\, encontrar 
uma trajectoria que minimiza (ou maximiza) uma certa fungao custo C(T,u). 
Uma tal trajectoria, se existir, diz-se optima para esse custo. A existencia de 
trajectorias optimas depende da regularidade do sistema e do custo. Para um 
enunciado geral de existencia vide, e.g., [T7l[l8]. Pode tambem acontecer que um 
controlo optimo nao exista na classe de controlos considerada, mas exista num 
espago mais abrangente. Esta questao remete-nos para outra area importante: 
o estudo da regularidade das trajectorias optimas. Francis Clarke e Richard 
Vinter deram um contributo importantissimo nesta area, introduzindo o estudo 
sistematico da regularidade lipschitziana dos minimizantes no controlo optimo 
linear [9l[l0l[34]. Resultados gerais de regularidade lipschitziana das trajectorias 
minimizantes para sistemas de controlo nao lineares podem ser encontrados em 
[29]. 

4.6 Principio do Maximo de Pontryagin 

Dado um problema de controlo optimo para o qual estao garantidas as condigoes 
de existencia e regularidade da solugao optima, como determinar os processos 
optimais? A resposta a esta questao e dada pelo celebre Principio do Max- 
imo de Pontryagin. Para um estudo aprofundado das condigoes necessarias de 
optimalidade sugerimos [H [26] [33] . 

Comegamos por mostrar que uma trajectoria singular pode ser parametrizada 
como a projecgao de uma solugao de um sistema hamiltoniano sujeito a uma 
equacao de restrigao. Consideremos o hamiltoniano do sistema ([9]): 

H :R n x K"\{0} x K m -» M 

{x,p,u) i-» H(x,p,u) = (p,f(x,u)) 
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onde ( , ) denota o produto escalar usual de M. n . 

Proposigao 15. Seja u um controlo singular ex a trajectdria singular associada 
a esse controlo em [0, T], Entdo, existe um vector linha contmuo p : [0,T] — > 
K ra \{0} tal que as equacdes seguintes sao verificadas para quase todo ot £ [0,T]: 

dH dH 

*(*) = -^-{x{t),p(t),u{t)), p(t) = - — ( x (t),p(t),u(t)) 
op ox 

dH 

-^—(x(t),p(t),u(t)) = (equagao de restricao) 
du 

onde H e o hamiltoniano do sistema. 

Demonstracao. Por definigao, o par (x,u) e singular sobre [0,T] se dExiu) nao 
e sobrejectiva. Logo existe um vector linha p £ IR n \{0} tal que 

Vv(-) GL°°([0,T]) (p 7 dE T (u) -v) =p { M(T)M- 1 (s)B(s)v(s)ds = 0. 



Consequentemente, 

pM(T)M- 1 (s)B{s) = em q.t.p. de [0, T] . 

Sejap(t) = pM^M- 1 ^), t £ [0,T]. Temos quep e um vector linha de R n \{0} 
e p(T) = p. Diferenciando, obtemos 

df 

P(t) = -p(t)-^(x(t),u(t)). 

Introduzindo o hamiltoniano H(x,p,u) — (p, f(x y u)) concliumos que 

OH 

x(t) = f(x(t),u(t)) = —(x(t),p(t),u(t)) 

e 

f OH 
p{t) = -p(t)-J-{x{t),u{t)) = - — ( x (t),p(t),u(t)) . 

A equagao de restricao vem de p(t)B{i) = pois Bit) = ^(x(t),u(t)). □ 

Definigao 16. Ao vector linha p : [0,T] — » M"\{0} da ProposicaofT5lchamamos 
vector adjunto do sistema ([9]). 



4.6.1 Princfpio do Maximo fraco (Teorema de Hestenes) 

Procuramos condigoes necessarias de optimalidade. Consideremos o sistema ([9]). 
Os controlos u(-) £ U sao definidos em [0, T] e tomam valores em Q = R m (nao 
existem restrigoes aos valores dos controlos). As trajectorias associadas devem 
verificar x(0) — xq e x{T) = x\. O problema consiste em minimizar um custo 
da forma ^ 

C(u)= f f°(x(t),u(t))dt, (10) 
Jo 
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onde /° : R" x W m -> R e uma aplicacao C°° e T esta fixo. 
Associamos ao sistema © o sistema aumentado 

x(t) = f(x(t),u(t)) 
x°(t) = f°(x(t),u(t)) 

e usamos a notacao x — (x,x°) e / = (/, /°). O problema reduz-se entao a 
procura de uma trajectoria solugao de (fTTj) com io = (xo, 0) e i\ — (x\, x°(T)) 
de tal modo que a ultima coordenada x°(T) seja minimizada. 

Seja xq — (xq, 0) fixo. conjunto dos estados acessiveis a partir de xq para 
o sistema (fTT]l e A(xo,T) — U u (.jx(T,xq,u). Seja, agora, u* um controlo e i* a 
trajectoria associada, solugao do sistema aumentado fTTj) saindo de io = (a;o, 0). 
Se u* e optimo para o criterio lfl0|) . entao o ponto x*(T) pertence a fronteira 
do conjunto A(xq,T). Com efeito, se assim nao fosse existiria uma vizinhanga 
do ponto x(T) = (xi,x°(T)) em A{xq,T) contendo um ponto y*(T) solugao 
do sistema l[TTj) e tal que y°{T) < x°(T), o que contradiz a optimalidade do 
controlo u* (Figura[l3|. Consequentemente, o controlo u* e, pela ProposicaofT2t 
um controlo singular para o sistema aumentado (fTTTl . 



x°\T) 




Xl 



Figura 13: se u* e optimo, entao x*(T) € Fr A(xq,T). 

Usando a Proposigao [15] obtemos o seguinte teorema. 

Teorema 17 (Princlpio do Maximo fraco - Teorema de Hestenes [E]). Se u* e 
um controlo optimo, entao existe uma aplicacao p* : [0,T] — > M' i+1 \{0} tal que 
(x*,p*,£t*) satisfaz o sistema hamiltoniano 

t(t) = ^(x*(t),p*(t),u*(t)), p*(t) = -^{x*(t) 1 p*{t),u*(t)) (12) 

e a condigao de estacionaridade 

^(x*(t),p*(t),u*(t))=0, (13) 



onde H(x,p,u) = (p, f(x,u)) . 
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Teorema [T7l tern a sua genese nos trabalhos de Graves de 1933, tendo sido 
obtido primeiramente por Hestenes em 1950 [16]. Trata-se de um caso particular 
do Princfpio do Maximo de Pontryagin, onde nao sao consideradas restrigoes 
aos valores dos controlos (i.e., u(t) £ f2 com fi = R m ). 

Escrevendo p* — (pi, . . . ,p n ,Po) — (P,Po) £ (K n x R)\{0}, onde po e a 
variavel dual do custo e p*(t) = —p*(t)fx(x*,u*(t)), temos que (p,Po) satisfaz 
o sistema 

(i>,Po) = ~{p,Po 




dH df df° 

■p— =0 =Ptt- +Po^r~ 
ou ou ou 

onde H = (p, f(x, u)) — p ■ f + Pof . Repare-se que Po(t) = 0, isto e, po{t) e 
constante em [0, T]. Como o vector p*(t) e definido a menos de uma constante 
multiplicativa, escolhe-se normalmente po < 0. 

Definigao 18. Uma extremal do problema de controlo optimo e um terno or- 
denado (x,p,u) solugao das equacoes fT2|) e (fl3|) . Se po = 0, dizemos que a 
extremal e anormal. Nesse caso ela nao depende do custo e (x(t),u(t)) e uma 
trajectoria singular do sistema 

A designacao anormal e historica. Sabe-se hoje que os minimizantes anor- 
mais sao frequentes e "normais" em muitos e variadissimos problemas de opti- 
mizagao. Ao leitor interessado no estudo de extremais anormais sugerimos o 
livro EI. 



4.6.2 Princfpio do Maximo de Pontryagin 

prindpio do maximo de Pontryagin e uma versao forte do Teorema[17|onde sao 
admitidas restrigoes sobre os valores dos controlos. A existencia de tais restrigoes 
e imposta pelas aplicagoes e altera por completo a natureza das solugoes. 
princfpio do maximo de Pontryagin e muito mais diflcil de demonstrar do que 
o Teorema de Hestenes (vide, e.g., [HI El])- Para uma abordagem simples ao 
princfpio do maximo de Pontryagin sugerimos dois livros excelentes escritos em 
lingua Portuguesa: |19[ 126). enunciado geral e o seguinte. 

Teorema 19 (Princfpio do Maximo de Pontryagin). Considere-se o sistema de 
controlo em K™ 

x(t)=f(x(t),u(t)), 

onde f : 1" x R™ — » 1" e de classe C 1 e onde os controlos sao aplicagoes 
mensurdveis e limitadas, definidos no intervalo [0, t(u)] de R. Denotemos por 
U o conjunto dos controlos admissweis cujas trajectorias associadas unem um 
ponto inicial de Mq a um ponto final de M\ . Para um tal controlo definimos o 
custo ^ ^ 

C(u)= f f(x(t),u(t))dt, 
Jo 
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onde f° : R" x R m -> K e de classe C 1 . 

Se o controlo u € U i optimo em [0,t»], eniao existe uma aplicagao nao 
trivial (i.e., nao identicamente nula) (p(-),p ) ■ [0,i»] — > R" x R absolutamente 
continua, chamada vector adjunto, onde p° e uma constante negativa ou nula, 
tal que a trajectdria optima x associada ao controlo u verifica, em quase todos 
os pontos de [0, t„], o sistema hamiltoniano 

dH . dH 

x = -g-{x,p,p ,u) , p= - — {x,p,p ,u) 

e a condigao do maximo 

H(x(t),p(t),p ,u{t))=m^H(x(t),p(t),p°,v), q.t.p. *e[0,tj, 

onde o hamiltoniano 7? e dado por H(x,p,p ,u) — (p,f(x,u)) + p°f°(x,u). 
Alem disso, tem-se para todo o t £ [0, tj gwe 

maxJT(a;(t),]5(t),p ,'y) = 0. (14) 

5e Mo e/ou Mi sao variedades de R n com espacos tangentes T x iq\Mq em x(0) S 
Mo e T x ( tit )Mi em a;(t*) G Mi, eniao o vector adjunto satisfaz as seguintes 
condigdes de transversalidade: 

p(0)_LT x (o)M e p(U)±T x{tr) Mi . 

Observagao 20. No Teorema[l9]o tempo final e livre. Se impusermos um tempo 
final fixo igual a T, isto e, se procuramos, partindo de Mo, atingir o alvo Mi em 
tempo T e minimizando o custo C{u) em [0, T] (problema a tempo fixo), entao 
o teorema continua verdadeiro, salvo a condigao i|14p que deve ser substitmda 
por 

max H(x(t),p(t),p°,v) = const Vi 6 [0,T] 
(com constante nao necessariamente nula). 

Observagao 21. O problema de tempo mmimo corresponde ao caso em que 
/° = 1. 

Observagao 22. Se o conjunto alvo Mi e igual a todo o R™ (problema com 
extremidade final livre), entao a condigao de transversalidade no instante final 
diz-nos que p(t*) = 0. 

O principio do maximo de Pontryagin e um resultado profundo e importante 
da Matematica contemporanea, com inumeras aplicagoes na Ffsica, Biologia, 
Gestao, Economia, Ciencias Sociais, Engenharia, etc. (vide, e.g., [4]). 

4.7 Exemplo: controlo optimo de um oscilador harmonico 
(caso nao linear) 

Reconsideremos o exemplo (nao linear) da mola, modelado pelo sistema de con- 
trolo 

x(t) = y{t) , 

y(t) = -x(t) - 2x(t) 3 + u(t) , 
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onde admitimos como controlos todas as fungoes u(-) seccionalmente contmuas 
tais que \u(t)\ < 1. objectivo consiste em levar a mola de uma posigao inicial 
qualquer (a;o,2/o = £o) a sua posigao de equilibrio (0,0) em tempo mmimo £*. 

Apliquemos o Princlpio do Maximo de Pontryagin a este problema. O hamil- 
toniano tern a forma 

H(x,y 1 p x ,p v ,p°,u) = p x y + p y (-x - 2x 3 + u) + p° . 

Se (x,y,p x ,p y ,p°,u) e uma extremal, entao 

Px = ~~dx~ = Py ( ' e Py = —qT = -Px ■ 

Notemos que uma vez que o vector adjunto (p x ,Py,P°) deve ser nao trivial, p y 
nao pode anular-se num intervalo (senao teriamos igualmente p x = —p y = 
e, por anulacao do hamiltoniano, teriamos tambem p° = 0). Por outro lado, a 
condigao do maximo da-nos 

p y u = maxp y (t) . 

\v\<l 

Em particular, os controlo optimos sao sucessivamente iguais a ±1, isto e, 
verifica-se o princlpio bang-bang (vide, e.g., [HI EI]). Concretamente, pode- 
mos afirmar que 

u(t) — sinal(p y (t)) onde p y e a solugao de < ^ ^ ^ ^ ^ 

\Py\t*) — cosa, Py(t*) = — sina, 

a e [0, 2ir[. Invertendo o tempo (t — t) o nosso problema e equivalente ao 
problema de tempo mmimo para o sistema 

f x(t) = -y(t) 

I y{t) = x{t) + 2x(t) 3 - sinal{p y (t)) 

I Py{t) =Px(t) 

[px(t) - -p y (t)(l + 6x(t) 2 ). 

Dadas as condigoes iniciais xq e io (posigao e velocidade inicial da massa), 
o problema e facilmente resolvido. leitor interessado encontra em [33J uma 
resolugao efectuada com o sistema de computagao algebrica Maple. Sobre o uso 
do Maple no calculo das variagoes e controlo optimo veja-se p~5j [20] . 

Nota final 

A Teoria Matematica dos Sistemas e Controlo e ensinada nas instituigoes dos 
autores, nos Departamentos de Matematica da Universidade de Aveiro e da Uni- 
versidade de Orleans, Franga. Em Aveiro no ambito do Mestrado Matematica e 
Aplicacdes, especializagao em Matematica Empresarial e Tecnologica [35], e no 
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ambito do Programa Doutoral em Matemdtica e Aplicacdes - este ultimo uma 
associagao entre os Departamentos de Matematica da Universidade de Aveiro 
e da Universidade do Minho [36j; em Orleans na opcao "Controlo Automatico" 
do Mestrado PASSION [37] . O primeiro autor foi aluno de Mestrado em Aveiro 
e faz actualmente um doutoramento em Aveiro e Orleans na area do Controlo 
Optimo, com o apoio financeiro da FCT, bolsa SFRH/BD/27272/2006. 

Agradecemos a um revisor anonimo a apreciagao cuidada e as numerosas e 
pertinentes observacoes, comentarios e sugestoes. 
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